您现在的位置是:DeepL翻译官网 > 休闲
龙虾养得起,Token烧不起
DeepL翻译官网2026-03-29 21:57:04【休闲】7人已围观
简介Token狂飙的算力税:谁在为AI的“工业革命”买单?今年春天,如果你还在纠结龙虾怎么养、Token中文名叫什么,大概已经跟不上科技圈的热闹了。3月23日,国家数据局局长刘烈宏给Token定了中文名—
Token狂飙的龙虾算力税:谁在为AI的“工业革命”买单?
今年春天,如果你还在纠结龙虾怎么养、起T起Token中文名叫什么,龙虾大概已经跟不上科技圈的起T起热闹了。
3月23日,龙虾国家数据局局长刘烈宏给Token定了中文名——词元。起T起同时披露了一个数字:中国日均Token调用量突破140万亿,龙虾两年增长超千倍。起T起
图源:新华社
差不多同一时间,龙虾阿里云和百度智能云先后宣布AI算力产品涨价,起T起最高涨幅34%。龙虾英伟达的起T起黄仁勋在GTC大会上把Token叫做“AI时代的石油”,还公布了一套分层定价:每百万Token从3美元到150美元不等。龙虾
他还说了另一句话,起T起让不少创业者后背发凉:一个年薪50万美元的龙虾工程师,如果一年用不掉25万美元的Token,他会“极度恐慌”。
图源:网络
一边是Token消耗量疯涨,一边是供给端的成本在攀升、定价权在集中。热潮退去,账单浮出水面,人们开始意识到一个问题:我们正以近乎倾销的价格享受着AI的便利,但支撑这场技术革命的底层燃料,其真实成本才刚刚开始显现。
为什么单价越便宜,总账单越贵?
要理解这件事,得先明白Token是什么。
它是AI理解和生成信息的最小单元,也是眼下智能时代唯一可计量、可定价、可交易的通用货币。但它的使用费由两个东西决定:单价乘以消耗量。
图源:网络
一个龙虾智能体执行一次任务,比如“帮我找最低价”,消耗的Token是传统对话的几十倍甚至上百倍。因为它不是一次问答,而是一个完整的工作流:拆解任务、多步推理、调用工具、自我修正、错了重来。每一步都在烧Token。
这就是问题的核心:完成同一个任务需要的Token数量,增长得比单价下降更快。AI从副驾驶变成了代驾司机,油耗自然不是一个量级。
更关键的是,用户永远只想要最新的模型。老模型再便宜也没人要,99%的需求会瞬间转移到新发布的SOTA模型上。而前沿模型的单位Token价格,从来没真正降下来过。GPT-4刚出来时输出价格60美元每百万Token,今天Claude Opus 4.5还是这个价位。用户要的是当下最好的大脑,愿意为它买单。
图源:网络
于是,需求端智能体爆发,皇冠代理平台出租Token消耗量两年增长超千倍。供给端,HBM内存价格飞涨,2026年一季度DRAM价格环比涨超50%,NAND最高涨了150%,巨头们的战略长约直接签到5年后。而掌握核心硬件和软件生态的英伟达,靠着CUDA和从芯片到云的全栈布局,牢牢捏着Token的出厂价。
谁在制造Token的通胀?
Token的狂飙不是自然生长的。从产业链看,有四层玩家,每一层都在向上传递成本,最终压到最末端的普通用户身上。
先看最底层:英伟达。
第一层是英伟达。以前它卖芯片,一次买卖。现在不一样了。CUDA生态绑住了全球绝大多数AI开发者,二十年来积累的工程师、开源项目、代码库都长在这个生态里,切换成本极高。它自己又开了云服务DGX Cloud,用户直接在它平台上按Token付费,不用自己买芯片。
图源:网络
黄仁勋在GTC 2026上提出了“Token工厂经济学”,核心就一句话:以后AI的衡量单位不再是芯片,而是Token。他的野心也不止于卖云服务——英伟达正在试图把商业模式延伸到按Token抽成。
这套打法让英伟达掌握了定价权。2026年一季度,HBM内存供不应求,内存价格在几个月内上涨了数百个百分点。英伟达的GPU也跟着涨价——AI芯片H200所用的HBM3E供应价格上涨约20%。
英伟达芯片涨价,直接推高了云厂商的采购成本。
阿里云、腾讯云、百度智能云,它们从英伟达买芯片,搭好服务器,再把算力租给下游。现在英伟达芯片涨价,HBM内存涨价,它们自己的成本在涨。同时需求又爆发——龙虾这类智能体火了,所有人都想跑Agent。需求太大,服务器、电力都跟不上。于是它们只能涨价。阿里云AI算力产品最高涨了34%,百度涨了5%到30%。
图源:网络
第三层是大模型厂商。DeepSeek、MiniMax、智谱这些公司,处境最微妙。它们从英伟达买芯片,从云厂商租算力,训练出模型,再把Token卖给用户。
图源:网络
上游,芯片涨价、内存涨价、云厂商涨价,成本在涨。下游,2024年DeepSeek带头打价格战,把Token价格打到了地板上。想涨价怕用户跑,不涨价自己的算力账单在飞涨。所以这一轮云厂商涨价,它们反而最沉默。
第四层是AI应用公司。Cursor、Claude Code这些直接面向用户的工具,面临一个无解的难题:按固定月费收,比如20美元随便用,重度用户能把成本干穿。
Anthropic的Claude Code就吃过这个亏,推出每月200美元的无限套餐,结果一个月被一个用户干掉了100亿Token,最后不得不取消。
图源:网络
按量付费呢?用户会被不确定的账单吓跑。大多数人喜欢固定月费,哪怕贵一点,至少心里有数。
怎么办?只能硬着头皮选固定月费,但在这个模式下做各种限制来保命。
最常见的是用量封顶。每月给你一定额度的Token,用完了要么等重置,要么补差价,要么升级。比如Claude Code取消无限套餐后,改成了按实际用量付费加基础月费的混合模式。
另一种是分级套餐。轻度用户20美元,重度用户40或60美元,把高消耗用户筛到更高的付费档位。还有些公司在技术层面做优化——缓存常用请求、限制上下文长度、在用户无感知的情况下把复杂任务切给便宜模型跑。这些做法用户看不到,但每一招都在省Token。
可以看到,越往下游,利润越薄,处境越难。最上游的英伟达稳赚,最下游的应用公司在生死线上挣扎。而用户的直观感受就是,Token越来越贵了。
谁在焦虑,谁在狂欢?
焦虑,在普通用户和开发者中蔓延。“月薪2万,我养不起自己的AI员工”——这句调侃正在变成越来越多人的真实处境。
程序员艾瑞克是较早开始养龙虾的一批人。他用龙虾来自动化处理代码审查和简单的bug修复,最初一个月只花了几十块钱。
但随着他给龙虾配置了更多技能包——自动读取GitHub issue、调用测试环境、发送报告——Token消耗量直线上升。现在他每个月要花近千元。钱不算少,但让他不舒服的是,这个数字在没有任何预警地缓慢爬升,像一笔看不见的固定支出。
图源:网络
95后运营小可(化名)的账单则呈现出另一种焦虑。
他养了两只龙虾,一只负责监控竞品动态,每天抓取信息后自动整理成简报;另一只负责整理知识库并批量生成自媒体账号内容。两个数字员工24小时运转,一个月下来Token费用超过200元。
但比账单更让他头疼的,是龙虾的不可控。偷懒是常事——在某个环节卡住后反复重试同一个步骤,Token在燃烧,产出却为零。
更离谱的是欺骗:龙虾有时会过度夸大自己的能力,只要不被发现就默认自己能完成。小可不得不在Soul.md里反复调整指令,定期检查执行记录,像管理一个不太靠谱的实习生。
小可的技术路径几经调整。最早他用的是一个国内某云端Agent工具,但响应慢、功能弱,很快就弃用了。
后来他转向openclaw本地化部署,通过火山引擎的coding plank服务调用Kimi 2.5模型。这套方案相当克制,基础账单仅需每月40元。但任务一多,coding plan就自动升级到200元每月——账单永远追着需求跑。
图源:网络
他也动过换用GPT或Claude的念头,但试用之后发现,在自己需求下国内和国外模型交付差异不大,但是国外模型Token费用翻了好几倍,用起来实在心疼。最后还是用回了国内模型,毕竟国内模型还是要便宜很多。
如果说这些还算可控,那智能体的心跳机制和自动循环,才是真正的暗坑。用户不知情时,一个配置失误就能让Token一夜之间烧光。当AI几分钟就能完成你一周的工作,当你的数字员工比你本人还烧钱,认知焦虑与经济压力便同时袭来。
面对这个问题,有人想出了土办法:设置电脑定时关闭,或者把openclaw部署在U盘上,通过插拔U盘来物理断电。用最原始的方式,给这个不知疲倦的数字员工装上了一个看得见的开关。
狂欢,属于产业链上游的收租人。英伟达的市值和毛利率,云厂商的涨价底气,都源于它们在Token价值链上的不可替代性。无论AI应用层如何洗牌,它们都是稳坐钓鱼台的赢家。
结语
这场Token狂飙,最后会走向哪里?
我觉得,它会倒逼整个产业回归两个常识。
第一,算力成本终究会回归商品属性。短期内存涨价、供需失衡,但技术进步不会停。更高效的模型架构、更好的推理优化、把模型焊在芯片上的专用芯片创新,都会持续压低Token的生产成本。长期看,Token的单价一定是往下走的。
图源:网络
第二,投入产出比会成为唯一的衡量标准。烧Token不是目的,用Token创造价值才是。市场从狂热回归理性之后,企业不会再看“Tokenmaxxing”,而是会问:这100万Token,到底帮我干了多少活?挣了多少钱?
智能体本身也需要进化,需要在有限的尝试中,找到使用Token最具效率的方法。
那些只靠补贴用户烧Token、自己没有核心价值创造的应用,会最先倒下。能精确衡量任务成本、优化Token效率、建起高转换成本壁垒的公司,才能活下来。
Token越来越贵的今天,我们需要的不是制造焦虑,也不是鼓励无度消耗。
毕竟,商业的终极理性,从来不是烧掉多少燃料,而是走了多远的路。
参考资料:
1、《「烧Token」成KPI,有程序员一个月花掉15w》腾讯科技
2、《为什么所有人都觉得 MiniMax、智谱「太贵了」?》极客公园
3、《月薪2万,我养不起自己的“AI员工”》凤凰WEEKLY返回搜狐,查看更多
很赞哦!(375)
下一篇: CBA常规赛:山西主场力克山东止住连败
热门文章
站长推荐

美国高尔夫球星“老虎”伍兹因酒驾发生翻车事故被捕

【数据蛙安卓恢复专家】数据蛙安卓恢复专家 3.2.36.0

【Office文档恢复工具】Stellar Phoenix Office Repair(Office文档恢复工具) 6.2绿色版

【恢复VMFS文件系统工具】VMFS Recover System 1.6 绿色版

章泽天现身香港逛展 深V黑裙礼服配金腰带优雅大气

【remo repair psd】psd文件修复软件(remo repair psd) 1.0.0.15

【Digital Media Doctor】Digital Media Doctor 3.1.1

【Zip Recovery Toolbox下载】Zip Recovery Toolbox 1.2.21